ASR bilingüe mejorado con habla sintética guiada por mezcla de códigos
Nuevo método de fine-tuning de Whisper reduce error en ASR bilingüe de 12.1% a 8.9% usando habla sintética guiada por índice de mezcla.
Nuevo método de fine-tuning de Whisper reduce error en ASR bilingüe de 12.1% a 8.9% usando habla sintética guiada por índice de mezcla.
Mejora el ASR bilingüe con habla sintética guiada por CMI: reduce el error mixto de 12.1% a 8.9% en Whisper Large.
Descubre PASQA, un modelo innovador que evalúa la calidad del habla enfocándose en la corrección de acentos tonales. Entrenado con acentos japoneses, supera a